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摘要 : [ 目的/ 意义] 推荐 结果 履 盖 用 户 的 不 同 兴趣 领域 ,良好 的 主题 多 样 性 对 于 提高 图 书馆 个 性 化 阅读 推 
荐 服务 的 用 户 满意 度 具 有 重要 意义 。[ 方 法/ 过程] 提出 一 种 基于 社交 网 络 分 析 的 阅读 推荐 方法 ,通过 用 户 的 兴 
趣 相似 好 友 ,挖掘 用 户 的 多 样 隐 性 兴趣 ,为 用 户 提供 主题 多 样 性 的 阅读 推荐 ,并 给 出 具有 良好 学 科 主 题 多 样 性 
的 高 校 图 书馆 图 书 推 荐 案例 。[ 结果 /结论 ] 用 户 社交 网 络 分 析 可 为 高 校 图 书馆 发 现 用 户 的 多 样 兴趣 ,进而 提供 
主题 多 样 性 的 阅读 推荐 服务 ,构建 用 户 多 元 知识 结构 提供 新 途径 。 
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主题 多 样 性 


随 着 Web2. 0 技术 的 普遍 应 用 , 微 博 、 微 信 、 博 客 、 
论坛 .播客 等 社交 网 络 服务 (social network service， 
SNS) 网 站 大 规模 兴起 。 高 校 师 生 普遍 使 用 社交 网 络 
工 县 进行 学 习 、 科 研 ` 工 作 上 的 交流 。Web2.0 和 SNS 
技 汶 也 被 引入 高 校 图 书馆 的 数字 化 服务 建设 ， ,构建 
论坛 \ 微 博 \ 微 信 公 众 号 .QQ 群 等 知识 服务 社区 。 基 于 
社交 网 络 的 线 上 服务 平台 和 服务 社区 为 高 校 图 书馆 发 
现 秋 聚合 用 户 个 性 化 需求 ,进而 建立 以 人 为 本 的 线 上 
线 瑟 一 体 化 的 阅读 推荐 服务 和 应 用 提供 了 新 的 途径 。 

三 互联 网 从 2.0 时 代 向 3.0 时 代 迈 进 , 社 交 网 络 数 
据 履 集 也 日 益 方便 。 不 仅 可 以 用 扑 虫 软件 从 网 页 中 获 
取信 息 ,还 可 以 利用 SNS 网 站 开放 的 应 用 程序 接口 自 
主 地 采集 所 需 数据 。 新 浪 微 博 、 人 人 网 腾讯 QQ 都 提 
供 了 开放 接口 ,为 社交 网 络 分 析 和 挖掘 提供 了 方便 。 
用 户 社交 数据 成 为 图 书馆 智慧 性 知识 服务 的 主要 数据 
资源 之 一 ”。 阮 光 册 和 夏 磊 ” 提出 结合 社交 平台 数据 
的 图 书馆 个 性 化 推荐 服务 。 文 献 调研 发 现 ,目前 图 书 
馆 领域 社交 网 络 应 用 的 实践 .研究 和 探讨 所 关注 的 重 
点 是 利用 社交 网 络 平台 进行 服务 模式 创新 ,如 在 社交 


平台 上 借助 社交 语 境 与 形式 ,开展 参考 咨询 服务 "以 
及 开展 阅读 传递 .交流 、 分 享 等 ”。 通 过 分 析 社交 网 
络 来 挖掘 和 聚合 图 书馆 用 户 需求 ,进而 为 用 户 提供 个 
性 化 阅读 推荐 服务 的 研究 较 少 。 因 此 ,本 研究 提出 一 
种 基于 用 户 社交 网 络 分 析 的 阅读 推荐 方法 ,有 助 于 图 
书馆 为 用 户 提供 主题 多 样 性 的 个 性 化 阅读 推荐 服务 ， 
为 社交 网 络 在 图 书馆 个 性 化 服务 中 进一步 发 挥 作用 提 
上 共 参 考 。 


1 图 书馆 个 性 化 阅读 推荐 研究 现状 及 


分 析 
1.1 图 书馆 个 性 化 阅读 推荐 研究 现状 

图 书馆 个 性 化 阅读 推荐 的 目的 是 发 现 目标 用 户 感 
兴趣 的 阅读 资源 ,为 此 需要 挖掘 出 目标 用 户 和 阅读 资 
源 的 二 元 关系 , 预测 目标 用 户 对 阅读 资源 的 兴趣 度 。 
主流 推荐 算法 包括 基于 关联 规则 的 推荐 算法 、 基 于 内 
容 的 推荐 算法 .协同 过 滤 推 荐 算法 以 及 混合 推荐 算法 
等 。 这 些 方法 通常 根据 用 户 属性 信息 历史 阅读 内 容 
以 及 借阅 .浏览 等 行为 数据 来 构建 用 户 特 征 模型 ,分析 
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用 户 兴趣 ,预测 用 户 对 资源 的 兴趣 度 。 预 测 结果 越 准 
确 ,推荐 结果 越 精确 。 

近年 来 ,国内 外 学 者 关注 从 图 书馆 用 户 行为 数据 
中 挖掘 个 性 化 信息 ,进而 提供 个 性 化 阅读 推荐 服务 , 取 
得 了 良好 的 效果 。K. Tsuji 等 采用 支持 向 量 机 挖掘 
图 书馆 借阅 日 志和 文献 信息 ,为 用 户 提供 图 书 推荐 。 
R. Li 中 针对 用 户 借 阅 记录 的 显 式 行为 数据 建立 协同 
过 滤 推 荐 模型 ,取得 了 良好 的 准确 率 。P. He 利用 
关联 规则 挖掘 读者 借阅 模式 ,取得 了 良好 的 推荐 准确 
率 和 覆盖 率 。 圳 银 池 等 "通过 挖掘 用 户 阅读 行为 数 
据 来 发 现 用 户 的 主题 兴趣 ,构建 用 户 微服 务 推荐 模型 ， 
实现 专利 文献 推荐 。 圳 虎 声 和 赵 洗 尘 !'2 应 用 用 户 借 
阅 数据 构建 加 权 借 阅 网 络 ,结合 复杂 网 络 理论 实现 个 
性 化 推荐 ,推荐 结果 具有 多 样 性 。M，Akbar 等 认为 
图 书馆 用 户 的 浏览 点击 .搜索 等 隐 式 反馈 行为 对 挖掘 
用 六 兴趣 非常 重要 ,并 基于 用 户 的 隐 式 行为 建立 演绎 
福 次 网 络 来 分 析 用 户 的 兴趣 , 进行 资源 推荐 。 田 壬 
等 本 提出 一 ee 
推荐 方法 ,将 行为 兴趣 相似 性 较 大 的 用 户 聚 集成 类 
国 肌 用 户 在 相应 的 聚 类 中 构建 最 近邻 a 
推 浪 ,提高 推荐 准确 性 。 何 胜 等 "5 将 用 户 行为 本 体 建 
模 和 大 数据 挖掘 技术 相 结合 ,在 用 户 登录 和 检索 过 程 
展 疯 供 个 性 化 推荐 服务 。 唐 晓 波 和 周 号 5 通过 构建 
图 官 基因 组 来 描述 图 书 各 方面 特征 ,根据 用 户 标注 信 
局 皆 析 用 户 对 图 书 基因 的 偏好 ,提高 了 推荐 结果 的 准 
确 闭 。 曾 子 明和 人 金鹏 "结合 用 户 标注 行为 ,重点 考虑 
标 徐 频 率 .标签 时 间 等 反映 用 户 行为 的 特征 ,构建 基于 
用 三 兴 趣 变 化 的 推荐 模型 。 还 有 学 者 将 用 户 评分 、 借 
阅 等 行为 和 地 理 位 置 .特定 时 间 的 情境 感知 相 结 合 , 构 
建 推荐 系统 ,为 用 户 提供 契合 其 所 处 情境 的 移动 阅读 
推荐 服务 。 
1.2 图 书馆 个 性 化 阅读 推荐 的 多 样 性 需求 

阅读 推荐 是 阅读 服务 和 阅读 推广 工作 中 的 一 项 重 
要 内 容 。 随 着 图 书馆 数字 化 、 网 络 化 建设 进程 的 快速 
推进 ,阅读 资源 日 益 丰 富 ,不 仅 有 纸 质 图 书 、 杂 志 、 报 
纸 .期 刊 等 ,还 有 图 像 音频 .视频 等 形式 的 多 媒体 数据 


但 是 多 样 性 不 足 ,用 户 会 
读 需 求 并 未 得 到 满足 。 
人 
性 ”| 新颖 性 ” ee a 
的 关注 。 多 样 性 的 推荐 结果 能 覆盖 用 户 不 同 的 兴 
ee 
户 对 于 推荐 项 目 了 解 甚 少 , 则 认为 该 项 目 足够 新 颖 。 
新 颖 项 目 一 般 都 是 长 尾 物品 。 如 果 推荐 的 项 目 和 用 户 
的 历史 兴趣 关联 不 大 ,而 用 户 又 非常 满意 , 则 认为 该 扒 
荐 给 用 户 带 来 了 惊喜 。 专 业 文 献 推 荐 强调 准确 性 , 阅 
读 推荐 需要 更 多 地 考虑 多 样 性 ,满足 用 户 多 样 的 兴 
喜好 ,甚至 让 用 户 感到 新 颖 、 惊 喜 , 激 发 用 户 的 阅读 积 
极 性 ,帮助 用 户 突破 阅读 思维 定 势 , 拓 展 视野 ,建构 多 
元 知识 体系 。 但 是 ,目前 的 图 书馆 阅读 推荐 研究 对 多 
样 性 探讨 较 少 ,或 虽 有 探讨 "” ,但 是 缺乏 多 样 性 的 定 
量 分 析 。 
1.3 ”用 户 社交 网 络 分 析 在 多 样 性 阅读 推荐 的 优势 
为 了 使 阅读 推荐 结果 具有 主题 多 样 性 ,不 宜 直接 
采用 传统 的 推荐 算法 ,需要 具有 多 样 性 的 推荐 方法 。 
利用 用 户 行为 .属性 信息 ,阅读 内 容 等 数据 来 挖掘 用 户 
兴趣 ,容易 使 推荐 陷入 片面 性 。 如 经 典 的 协同 过 滤 推 
荐 方法 主要 依赖 于 用 户 与 用 户 之 间 对 项 目的 利用 或 选 
人 


觉得 自己 对 于 其 他 主题 的 阅 


果 缺 乏 多 样 性 ” 。 周 涛 ”指出 ,推荐 的 多 样 性 与 准确 
性 存在 两 难 困境 ,但 也 有 研究 者 设计 算法 时 考虑 到 两 


者 的 平衡 ”““ ,使 两 者 都 得 以 明显 提高 。 多 样 性 和 准 
确 性 之 间 尽 管 存在 苋 争 ,但 是 在 实践 中 可 以 彼此 平衡 、 
共同 提高 。 与 应 用 用 户 行为 数据 和 属性 信息 相 比 ,用 
户 社交 网 络 分 析 在 发 现 用 户 多 样 隐 性 兴趣 ,进而 提高 
图 书馆 个 性 化 阅读 推荐 的 多 样 性 方面 具有 优势 
社会 化 网 络 中 存在 传递 性 “小 世界 效应、 社区 
结构 等 特性 ” ,社会 化 网 络 方法 是 平衡 推荐 准确 性 和 
多 样 性 的 主要 方法 之 一 ,能 在 尽 可 能 不 影响 前 者 的 情 
况 下 提高 后 者 ”。 张 富国 和 徐 升华 提出 了 基于 社 
会 网 络 信任 的 个 性 化 推荐 算法 ,通过 选择 主题 多 样 性 
好 的 信任 邻居 来 平衡 推荐 结果 的 准确 性 和 多 样 性 ,在 


的 大 量 涌现 ,成 为 新 的 阅读 媒介 。 在 这 种 形势 下 ,阅读 
推荐 不 再 局 限于 单一 的 图 书 推荐 。 目 前 ,以 图 书 推荐 
为 主 的 个 性 化 阅读 推荐 注重 推荐 的 准确 性 。 但 是 , 仅 
有 高 准确 性 并 不 能 保证 用 户 有 高 满意 度 。 如 一 位 用 户 
借阅 了 《数据 挖掘 算法 原理 与 实现 一 书 ,如 果 采 用 传 
统 的 基于 文献 相似 度量 的 协同 过 滤 推 荐 算法 ,推荐 系 
统 便 会 集中 推荐 数据 挖 据 方 向 的 文献 ,虽然 准确 性 高 ， 
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电子 商务 推荐 中 取得 了 良好 的 效果 。Q，Wu 等 基 
于 用 户 的 社会 好 奇 心理 ,在 社会 网 络 中 发 现 用 户 偏 好 
和 用 户 好 奇 ,推荐 结果 在 准确 性 和 和 多样 性 指标 上 都 表 
现 良 好 。H. Wu 等 通过 在 社会 网 络 中 发 现 用 户 之 
间 的 社会 关系 来 挖掘 用 户 的 隐 性 兴趣 ,从 而 提高 推荐 
的 多 样 性 。 

要 提高 推荐 结 


吉 果 的 多 样 性 而 不 失 准 确 性 ,不 仅 需 
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要 提取 用 户 的 显 性 兴趣 ,还 需要 发 现 用 户 的 多 样 隐 性 
兴趣 和 广泛 的 深层 次 需求 。 社 交 网 络 用 户 具 有 社会 
化 .相关 性 强 的 特点 。 社 交 网 络 产生 了 大 量 用 户 以 及 
实时 .多样 的 用 户 数据 ,记录 了 丰富 的 用 户 关系 和 交流 
内 容 。 用 户 的 借阅 .检索 等 行为 记录 表现 了 其 对 阅读 
资源 的 显 性 兴趣 ,而 社交 网 络 中 用 户 之 间 的 关系 、 兴 
关联 则 蕴含 了 用 户 的 多 样 隐 性 兴趣 。 用 户 常常 和 好 友 
有 共同 或 相似 兴趣 , 且 愿 意 信任 好 友 的 推荐 。 例 如 ,一 
位 教师 借阅 了 一 本 知识 工程 主题 的 图 书 ,他 在 科研 群 
的 好 友 借阅 了 机 器 学 习 主题 的 图 书 , 向 该 教师 推荐 机 
器 学 习 主题 的 图 书 , 他 很 可 能 会 心动 阅读。 推荐 机 器 
学 习 主题 类 图 书 便 提 高 了 推荐 结果 的 主题 多 样 性 。 深 
入 分 析 社 交 网 络 可 以 帮助 图 书馆 更 好 地 提供 覆盖 用 户 
押 样 兴趣 的 个 性 化 阅读 推荐 服务 。 
2 多 样 性 阅读 推荐 方法 和 多 样 性 度量 
2 入 9 基于 用 户 社交 网 络 分 析 的 阅读 推荐 方法 
同一 组 群 用 户 之 间或 者 用 户 和 好 友之 间 常 常 有 共 
]3 趣 ;两 位 用 户 共同 点 赞 某 篇 文章 ,相互 转发 微 博 ， 
天 本 同一 话题 的 讨论 等 都 在 一 定 程度 上 表示 他 们 具有 
共同 或 相似 兴趣 。 构 建 和 分 析 社 交 网 络 图 模型 是 研究 
社 33 网 络 的 一 种 重要 方法 。 本 研究 提出 一 种 基于 用 户 
社 认 网络 分 析 的 阅读 推荐 方法 ,根据 目标 用 户 在 社交 
网 给 中 的 好 友 关 系 ,以 用 户 为 节点 、 关 系 为 边 ,构建 目 
栅 博 户 的 社交 网 络 图 模型 ,分 析 目 标 用 户 和 好 友之 间 
的 兴趣 相似 度 ,多 位 好 友 近 期 的 多 样 阅读 兴趣 传递 给 
目标 用 户 , 从 而 发 现 目标 用 户 的 多 样 隐 性 兴趣 ,向 其 提 
里 昌 有 良好 多 样 性 的 阅读 推荐 服务 。 

给 定 目标 用 户 ww 的 好 友 用 户 集合 Ku) ,/(z) 阅 
读 的 资源 集合 5,/(w) 的 阅读 资源 使 用 记录 忆 , 按 以 下 3 
个 步骤 得 到 用 户 的 推荐 列表 R(u) 。 

(1) 第 1 步 :构建 目标 用 户 的 社交 网 络 图 模型 。 根 
据 目 标 用 户 u 的 社交 网 络 , 构 建 其 社交 网 络 图 6G。G 为 
三 元 组 <V, E,WW> ,V 表示 用 户 节点 集合 ;E 表示 连 
接 节点 的 边 集 ,两 位 用 户 是 好 友 关 系 则 在 相应 用 户 节 
点 之 间 用 边 相 连 ;下 表示 边 的 权 值 集合 ,以 两 位 用 户 的 
兴趣 相似 度 作为 连接 他 们 的 边 的 权 值 。 

用 户 & 和 好 友 v(v ef(w) ) 之 间 有 边 (4, o) ,uw 和。 
的 兴趣 相似 度 记 为 ws(w, v) , 则 边 (u,v) 的 权 值 ww 为 
us(u, 0) , 即 : 


SW 


公式 (1) 
& 和 vw 的 兴趣 相似 度 us (u,v) 可 以 用 多 种 方法 度 
,如 他 们 近期 在 社交 网 络 中 的 会 话 次 数 .会话 时 间 长 


W = us(u, v) 


好 


度 以 及 共同 参与 话题 的 数量 等 。 这 里 采用 w 和 vw 共同 
点 赞 文章 占 两 人 全 部 点 赞 文章 的 比例 来 度量 , 见 公式 
(27): 


wl) = 1 OE Pel 
其 中 ,z(w) 和 z(v) 分 别 表示 用 户 w 和 用 户 v 在 社 
交 网 络 的 点 赞 文章 集合 。 


(2) 第 2 步 : 计 算 目标 用 户 对 阅读 资源 的 兴趣 度 。 
根据 社交 网 络 图 G 和 阅读 资源 使 用 记录 世 , 按 公式 (3 ) 
计算 目标 用 户 w 对 5 中 资源 i 的 兴趣 度 p,: 

Pa = ,NT 公式 (3) 
其 中 ,w. 是 wu 和 vw 之 间 边 的 权 值 ;r, 表 示 用 户 w 的 
好 友 用 户 v 是 否 对 资源 上 有 兴趣 ,如 果 世 中 有 用 户 " 的 
资源 ;使 用 记录 ,表示 用 户 " 喜欢 资源 区 则 rm =1 ,否则 


ri=0。 
按 公 式 (3) 逐 一 计算 出 用 户 w 对 5S 中 所 有 资源 的 
兴趣 度 。 


(3) 第 3 步 : 取 得 阅读 推荐 列表 。 按 目标 用 户 v 的 
兴趣 度 从 高 到 低 对 $ 中 的 资源 排序 , 取 前 面 知 干 项 目 
得 到 top -N 推荐 列表 R(vz) 。 还 可 以 设 定 兴趣 度 阔 值 
a, 取 目标 用 户 兴 趣 度 不 小 于 a 的 项 目 组 成 推荐 列表 民 
(zu) 。 
2.2 主题 多 样 性 度量 

要 取得 良好 的 主题 多 样 性 阅读 推荐 效果 ,需要 科 
学 的 主题 多 样 性 度量 方法 。 个 性 化 推荐 的 多 样 性 主要 
有 3 个 方面 的 含义 :个 体 多 样 性 .总 体 多 样 性 和 时 序 多 
样 性 ”i。 个 体 多 样 性 和 总 体 多 样 性 分 别 从 单个 用 户 
和 全 体 用 户 的 角度 度量 推荐 结果 的 多 样 性 ,时 序 多 样 
性 考察 推荐 结果 随时 间 的 变化 程度 。 多 样 性 度量 方法 
有 多 种 ,文献 [34] 给 出 了 如 下 的 个 体 多 样 性 和 总 体 多 


样 性 度量 。 
2.2.1 个 体 多 样 性 度量 “个 体 多 样 性 可 以 通过 推荐 
列表 中 项 目 之 间 的 不 相似 性 来 衡量 ,项 目 之 间 的 不 相 


似 性 越 高 , 即 相似 度 越 低 ,多 样 性 便 越 高 。 设 R(w) 是 
用 户 w 的 推荐 列表 ,s(i, )) [10,1] 表示 项 目 i 和 项 目 j 
之 间 的 相似 度 , 个 体 多 样 性 度量 D(R(u) ) 描述 推荐 列 
表 R(u) 中 项 目的 两 两 不 相似 性 , 按 公 式 (4) 计 算 : 


i,jeR(u) ,1 ( i 3 


0 
公式 (4) 
2.2.2 总 体 多 样 性 度量 总体 多 样 性 D 定义 为 所 有 
目标 用 户 推 荐 列表 多 样 性 的 平均 值 : 
D= SD(R(u)) 公式 (5) 
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公式 (5) 中 U 是 目标 用 户 集合 。 

在 图 书馆 的 主题 多 样 性 阅读 推荐 中 ,阅读 资源 ; 
和 j 的 相似 度 s(i, 让 按 两 者 的 主题 关联 度 计算 : 奉 资 
源 i 和 资源 j 属 于 同一 学 科 主 题 ,s(i, j) =1; 若 属于 联 
系 较 密 切 的 不 同学 科 主 题 ,s(i, j) =0.5; 耕 属于 关联 
较 小 或 无 关联 的 不 同学 科 主 题 ,s(i, 7) =0。 根 据 公式 
(4) 计 算出 个 体 主题 多 样 性 ,根据 公式 (5) 计 算出 总 体 
主题 多 样 性 。 


3 ”主题 多 样 性 的 个 性 化 阅读 推荐 案例 


本 研究 以 高 校 图 书馆 图 书 推荐 为 例 , 提 出 阅读 推 
荐 方法 ,并 从 个 体 多 样 性 角度 对 推荐 结果 的 主题 多 样 
性 进行 探讨 。 
3 了 基于 用 户 社交 网 络 构建 和 分 析 的 图 书 推荐 

一 基于 上 述 阅读 扒 荐 方法 ,为 用 户 提供 学 科 主 题 多 
样 凯 的 个 ; 性 化 图 书 推 荐 。 根 据 目 标 用 户 在 图 书馆 QQ 
阴 民 务 社区 中 的 好 友 关系 ， 构造 其 社交 网 络 图 ( 见 图 
= 1 中 用 户 1 是 目标 用 户 。 考 虑 到 用 户 的 兴趣 会 
随 央 间 而 变化 ， 根据 用 户 一 个 月 内 的 社交 情况 和 借阅 
情 加 进行 推荐 ,以 使 推荐 结果 符合 目标 用 户 的 当前 兴 
十 s 用户 1 的 8 位 好 友 中 ,用 户 2.3 .4.5 是 最 近 一 个 
月 丰 与 用 户 1 有 共同 点 赞 文章 的 4 位 好 友 。 用 户 1 点 
铣 .六 篇 文章 ,用 户 3 点 赞 17 篇 文章 ,他 们 共同 点 赞 12 
篇 空 章 。 根据 公式 (2) ,以 共同 点 赞 的 文章 比例 衡量 
有 所 间 近期 兴 < 趣 相 似 度 , 目 标 用 户 1 和 用 户 3 兴趣 相 
似 嵌 ws(1， 3) = 12/(15 +17 -12) =0.6。 按 公式 
(1 起用 户 1 节点 和 用 户 3 节点 之 间 边 的 权 值 wa = us 
(163) =0.6。 ws wun 和 as 的 计算 类 似 。 若 目标 用 户 
1 与 某 位 好 友 近 1 个 月 无 共同 点 赞 文章 ， 两 人 兴趣 相 


二 


似 度 为 0, 则 该 好 友 的 阅读 兴趣 不 向 目标 用 户 传递 
计 两 者 之 间 边 权 值 。 


Rs 


图 1 


目标 用 户 1 社交 网 络 


表 1 是 用 户 1 -5 近 一 个 月 中 图 书 借阅 记录 ,以 及 
按 公式 (3 ) 计算 所 得 的 用 户 1 对 用 户 2.3.4.5 所 借 图 
书 的 兴趣 度 。 如 对 《隐私 保护 数据 发 布 :模型 与 算法 》 
一 书 的 兴趣 度 是 0.5 x1+0.2 xl =0.7。 设 兴趣 度 阔 
值 a 为 0.5 ,得 到 表 2 所 示 的 图 书 推 荐 列表 。 表 2 中 给 
出 了 图 书 所 属 学 科 主 题 和 《中 国 图 书馆 分 类 法 》( 简称 
《中 图 法 》) 分 类 号 ,该 分 类 号 系 采用 《中 图 法 》 对 文献 
进行 主题 分 析 , 并 依照 文献 内 容 的 学 科 属 性 和 特征 分 
门 别 类 地 组 织 文献 ,所 获取 的 分 类 代号 。 首 先 找 出 
图 书 所 属 类 目 及 相应 《中 图 法 ) 分 类 号 ,再 根据 图 书 内 
容 确 定 其 学 科 主 题 。 如 《基于 社会 化 标签 的 Web 知识 
推送 :网 络 分 析 视 角 》 一 书 属于 “TP182 专家 系统 .知识 
工程 "类 目 ,根据 该 书 内 容 确定 学 科 主 题 为 “知识 工 
程 ”。 如 果 采 用 传统 的 基于 图 书 相 似 的 协同 推荐 方法 ， 
得 到 的 推荐 列表 中 ,前 4 种 图 书 的 学 科 主 题 为 “数据 采 
集 ” ,后 4 种 图 书 的 学 科 主 题 为 “机 器 学 习 ”。 


表 1 用 户 图 书 借阅 记录 
借阅 人 书 名 ISBN 兴趣 度 
用 户 1( 目标 用 户 ) 《数据 挖掘 算法 原理 与 实现 》 9787302376415 
《机 器 学 习 算 法 原理 与 编程 实践 》 9787121273674 
户 2 《基于 社会 化 标签 的 Web 知识 推送 :网 络 分 析 视 角 》 9787030374066 0.8 
《语义 网 技术 体系 》 9787030422132 0.8 
《数据 挖掘 核心 技术 揭秘 》 9787111519249 0.8 
户 3 《数据 挖掘 与 预测 分 析 》 9787302459873 0.6 
《图 书馆 数字 资源 长 期 保存 元 数据 规范 》 9787501357314 0.6 
《图 书馆 管理 与 阅读 服务 》 9787519411930 0.6 
用 户 4 《隐私 保护 数据 发 布 :模型 与 算法 》 9787302421771 0.7 
《实用 机 器 学 习 》 9787115446466 0.5 
户 5 《人 工 智能 :一 种 现代 的 方法 》 9787302331094 0.2 
《隐私 保护 数据 发 布 :模型 与 算法 》 9787302421771 0.7 
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有 有 Og ChinaXiv 合 作 期 和 
柳 益 君 ， 何 胜 ， 吴 智 勒 ， 等 . 基于 用 户 社交 网 络 分 析 的 高 校园 书馆 主题 多 样 性 阅读 推荐 []]. 图 书 情报 三 作 光 0]8 ,5 从 8 
67 -73. 
表 2 基于 用 户 社交 网 络 分 析 的 图 书 推荐 列表 
序号 书 名 作者 出 版 社 /时 间 学 科 主 题 We 

1 《基于 社会 化 标签 的 Web 知识 推送 :网 络 分 析 视角 》 易 明 科学 出 版 社 /2013 知识 工程 TP182 

2 《语义 网 技术 体系 》 瞿 裕 忠 , 胡 伟 , 程 秦 科学 出 版 社 /2015 知识 工程 TP182 

3 《数据 挖掘 核心 技术 揭秘 》 机 双 成 , 王 奇 机 械 工业 出 版 社 /2015 数据 采集 TP274 

4 《隐私 保护 数据 发 布 :模型 与 算法 》 吴 英杰 清华 大 学 出 版 社 /2015 数据 管理 TP274 

5 《数据 挖掘 与 预测 分 析 》 [ 美 ]Daniel T. L.，, Chantal D. L. 清华 大 学 出 版 社 /2017 数据 采集 TP274 

6 《图 书馆 数字 资源 长 期 保存 元 数据 规范 》 中 华人 民 共 和 国文 化 部 国家 图 书馆 出 版 社 /2016 数字 图 书馆 G250 

7 《图 书馆 管理 与 阅读 服务 》 王 宁 , 吕 新 红 , 哈 森 光明 日 报 出 版 社 /2017 ”图 书馆 管理 /图 书馆 服务 G251/G252 

8 《实用 机 器 学 习 》 孙 亮 , 黄 倩 人 民 邮 电 出 版 社 /2017 机 器 学 习 TP181 
3.2 推荐 图 书 的 主题 多 样 性 分 析 气泡 数量 更 少 且 更 小 , 故 社 交 网 络 分 析 推 荐 的 图 书 两 


按 2.2 节 中 的 个 体 主题 多 样 性 度量 方法 来 定量 分 
析 推 荐 图 书 的 多 样 性 。 协 同 过 滤 推 荐 结果 和 社交 网 络 
分 析 推荐 结果 的 图 书 两 两 相似 度 比较 见 图 2, 模 纵 华 
标 夫 示 图 书 在 推荐 列表 中 的 序号 ,气泡 旁边 的 数字 表 
示 两 本 图 书 的 相似 度 。 例 如 ,图 2(b) 中 (3, 4) 位 置 的 
作 数 字 为 0.5, 表 示 表 2 推荐 列表 中 序号 3 和 序号 4 


的 两 本 图 书 相似 度 为 0.5。 与 图 2(a) 相 比 ,图 2(b) 中 


两 相似 度 更 低 ,更 具 多 样 性 。 推 荐 列表 有 8 种 图 书 , 故 
IR(u)1=8。 根 据 图 2(b) 中 的 图 书 相 似 度 , 按 公 式 
(4) 计 算 , 用 户 社 交 网 络 分 析 推 荐 的 多 样 性 是 1 -2 x 
(1+1+0.5+0.5+0.5)/(8 x (8-1)) =0.875。 同 
样 ,根据 图 2(a) 和 公式 (4) ,可 以 得 到 基于 图 书 相 似 的 
协同 过 滤 推 荐 的 多 样 性 是 1 -2 x (lx12)/(8x(8- 
1)) =0.571, 


8 Qi:9Q9i:Q! 8 
7 QQ 家 @ 05 
6 OQ! 6 
5 5 O190; 
4 O19101 全 05 
3 Qi:Q! 3 
家 © 9 基于 图 书 相似 的 协同 过 滤 2 = @ 基 于 用 户 社交 网 络 分 析 的 
| 推荐 (多样 性 0.571) | 推荐 ( 多 样 性 0.873) 
《 1 4 = 7 8 1 灾 “村 4 5 6 也 8 
1 加 协同 过 滤 推 荐 多 社交 网 络 分 析 推荐 
9 2 两 种 推荐 结果 的 图 书 两 两 相似 度 比 较 


定量 分 析 表 明 ,基于 用 户 社交 网 络 分 析 的 图 书 推 
厦 列 表 多 样 性 更 佳 。 从 协同 过 滤 推 荐 方法 和 社交 网 
络 分 析 推 荐 方法 的 准确 率 来 看 ,前 者 的 推荐 图 书 均 
符合 目标 用 户 的 兴趣 ,准确 率 达到 100% ;而 后 者 的 
推荐 图 书 中 目标 用 户 对 《隐私 保护 数据 发 布 :模型 与 
算法 ) 一 书 不 感 兴趣 ,准确 率 是 87. 5% ,虽然 比 前 者 
略 低 ,也 达到 了 较 高 水 平 。 基 于 社交 网 络 分 析 的 阅 
读 推荐 在 准确 率 和 多 样 性 上 达到 了 良好 的 平衡 。 毕 
合 考虑 , 目标 用 户 对 基于 社交 网 络 分 析 的 推荐 更 满 
意 , 原 因 在 于 他 近期 在 与 好 友 用 户 2.3 .4 共同 探讨 互 
联网 + 图 书馆 的 知识 服务 ,彼此 之 间 兴 趣 相似 度 很 
高 ,从 而 认为 多 样 主题 的 推荐 图 书 有 助 于 自己 的 近 
期 研究 ,更 有 阅读 价值 ,主观 上 对 多 样 性 的 推荐 结果 
的 满意 度 更 高 。 


近年 来 ,高 校 图 书馆 建立 了 基于 社交 网 络 的 服务 
平台, 进行 信息 发 布 , 信 息 咨询 学 科 知 识 服 务 。 用 户 
与 图 书馆 的 互动 ,以 及 用 户 之 间 交 流 讨论 ,发 表 观 点 、 
相互 评论 和 点 赞 ,为 发 现 用 户 兴趣 和 需求 ,进行 个 性 化 
阅读 推荐 提供 了 新 的 途径 。 用 户 和 好 友 通 常 有 共同 或 
相似 兴趣 ,本 研究 据 此 提出 一 种 基于 用 户 社交 网 络 分 
析 的 主题 多 样 性 阅读 推荐 方法 ,通过 用 户 在 社交 网 络 
中 的 兴趣 相似 好 友 来 挖掘 用 户 的 多 样 隐 性 兴趣 ,实现 
多 样 性 推荐 。 首 先 采 用 目标 用 户 和 好 友 的 共同 点 赞 文 
章 占 两 人 全 部 点 赞 文章 的 比例 来 计算 他 们 的 兴趣 相似 
度 ,然后 将 好 友 的 多 样 阅读 兴趣 以 兴趣 相似 度 为 权重 
传播 给 目标 用 户 ,得 到 目标 用 户 对 阅读 资源 的 兴趣 度 ， 
最 后 根据 兴趣 度 值 进行 top-N 推荐 ,或 者 取 兴 趣 度 值 
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大 于 设 定 阔 值 的 阅读 资源 进行 推荐 。 本 研究 还 根据 所 
提出 的 方法 ,给 出 了 高 校 图 书馆 的 图 书 推荐 案例 。 案 
例 的 个 体 多 样 性 分 析 表 明 , 用 户 社交 网 络 能 帮助 发 现 
用 户 的 隐 性 兴趣 ,进而 为 用 户 提供 符合 当前 需求 的 主 
题 多 样 性 阅读 推荐 。 

用 户 社交 网 络 分 析 在 阅读 推荐 服务 中 有 一 定 应 用 
价值 ,可 以 作为 传统 阅读 推荐 策略 的 有 益 补 充 。 需 要 
指出 ,本 研究 是 初步 的 ,提出 的 方法 存在 着 局 限 性 。 本 
研究 通过 典型 案例 来 说 明 方法 过 程 , 仅 从 个 体 多 样 性 
的 角度 讨论 推荐 结果 。 在 案例 中 , 仅 考虑 用 户 近 一 个 
月 的 社交 和 借阅 情况 ,虽然 有 助 于 推荐 结果 合乎 用 户 
当前 兴趣 ,但 是 若 目标 用 户 的 兴趣 相似 好 友 在 短 时 间 
内 借阅 太 少 甚至 没有 借阅 ,会 造成 推荐 项 目 缺乏 。 在 
后 续 工 作 中 ,需要 研究 选取 更 为 合适 的 时 间 窗口 ,避免 
更 没有 阅读 资源 推荐 的 极端 情况 。 同 时 ,进一步 从 
族 侯 多 样 性 的 角度 分 析 推荐 结果 的 主题 多 样 性 ,根据 
入 结果 改进 ,完善 推荐 方法 ,使 基于 用 户 社交 网 络 分 
析 枫 高 校 图 书馆 个 性 化 阅读 推荐 服务 能 更 好 地 满足 用 
记 的 多 样 阅读 兴趣 ,为 用 户 提供 多 元 知识 ,促进 知识 迁 
移 = 知 识 互 补 和 知识 创新 。 
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Abstract: [Purpose/significance | That the recommendation results cover the diverse interests of users and have 


|e 


good subject diversity is of great significance for improving the user satisfaction of library personalized reading recommen- 
dation services. | Method/process | This paper proposes a reading recommendation method based on social network anal- 
yx which supplies users with reading recommendation with subject diversity through mining the user’ s diverse implicit 
intenpsis by his friends who have similar interests with him. A book recommendation case of university library which has 
g0 od subject diversity is given. | Result/conclusion | The analysis of user social network supplies university libraries with 
thesiew way of discovering diverse interests of users so as to provide reading recommendation services with subject diversity 
aridl@onstruct the multiple knowledge structure of users. 


YKeywords: university library analysis of user social network personalized reading recommendation subject di- 
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《图 书 情报 工作 》 一 直 秉持 发 表 优 秀 学 术 论 文成 果 、 促 进 业 界 学 术 交 流 的 使 命 ,并 致力 于 净化 学 术 出 版 环境 , 创 
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